---
title: 如何训练出专属于“你”的问答机器人？
---


_作者：阿乔_

_火枪击穿了专属于骑士阶层身披的铠甲与荣耀，武力对等才会有真正的平权。_

技术平权的速度从未来得如此之快。

作为兢兢业业的 CODING DevOps 项目的技术文档工程师，在为产品贡献数百篇文档后，依然止不住要在各种用户群 / 技术支持群里为客户解答问题。即使在每条答复中贴上文档链接，依然架不住新用户反复提问。（没办法，DevOps 产品中间又包含多项子产品）

_注：CODING DevOps 是腾讯云旗下的一站式研发管理平台及云原生开发工具，旨在让软件研发如同工业生产般简单高效，助力提升企业研发管理效能。_

虽然由 ChatGPT 掀起 AI 革命已来，但是它并不能够回答“我的”问题，也不能回答“你的”问题。但它却可以回答“大家”的问题。

为什么？ChatGPT 本身便是由庞大的互联网语料库训练而成，并且这部分训练数据截止于 2021 年 9 月。如果你的产品在这个日期之前就有幸在互联网中占有一席之地，那恭喜你，GPT 可以大概率可以回答出你的产品是大概是干嘛用的。因为它会从你的官网收集已有的描述语料。具体到单独的产品或公司的细节时它便开始靠胡言乱语来敷衍你了。

例如这样 🔽

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/f7ddcb5342558d19fd51d7222be5209d.png)

这里的“胡言乱语”指的是它会用其他不相关的概念进行回答，并且**你并不能够预期什么问题会有什么回答，这在商业场景下十分致命。在大多数情况下，ChatGPT 对于一些带有公理性质**的知识回答是没有问题的，作为一个可以日常侃大山闲聊的对象依然是合格的，可是你却看着它的强大的学习和理解能力望洋兴叹。

**“你这个孙悟空什么时候才能懂我，给我想要的回答？”**

这也是为什么说它能够回应大家的问题，但是却不能够回答出“我”想要的问题。

### **改变发生**

直到，Dify 横空出世。

你可以简单地将 Dify 理解为是一个能够帮助你进行数据清理和文档训练的地方。咱们也给狗屁通（GPT）补补课，手动给它补上缺失的语料。把它从通用型聊天机器人，变成你的专业问答机器人。是的，从侃大山到对答如流，这中间的鸿沟不是一点半点，需要强大的理解、归纳总结能力。不过这正是狗屁通（GPT）的强项。

### **注册并生成应用**

现在，我们打开 Dify 并注册一个聊天机器人，我们在这里选择“聊天助手”。

![](https://assets-docs.dify.ai/2024/11/8f25c739e69de061496637f08334dd1b.png)

填写基础的名称和描述，选择某个 LLM 来提供对话服务。点击发布，Duang，一个聊天机器人就做好了。访问左侧的“监测”，你可以看到这个应用的在线地址。

![](https://assets-docs.dify.ai/2024/11/15e39d55291a97e59e8349a2f84302ee.png)

但是，它现在也只是一个**通用型聊天机器人**，离商业可用的**专用型问答机器人**还差一个语料的距离。

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/e753c7f36e8a2f04c8180f771e63431b.png)

### **准备语料**

Dify 提供了一个名 **“知识库”** 功能，这里就是我们上传语料的地方。

![](https://assets-docs.dify.ai/2024/11/46204d061fe14ada59735229a85e8d1a.png)

现在点击“创建知识库”选项，上传你的文本内容。

![](https://assets-docs.dify.ai/2024/11/1f35dc6c1b4ee2c307e024fb9755d417.png)

目前 Dify 仅支持上传单个文件，文件格式支持 TXT、HTML、MarkDown、PDF。

_是的没错，你也可以把电子书上传进来，用 AI 帮助你提炼书本内容。_

在正式开始训练前，我们得先把教材准备好。好在 CODING 之前的所有文档皆以 Git 代码仓库 + Markdown 的形式进行协作，因此我只需要先把文档先拉到本地中。不过我现在碰到了第一个问题，那就是如何把仓库中的这一系列 .md 文档文件合并至同一个文件中？

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/88018cc39f6b1244ffd5a1c11fc8ccbe.png)

不怕，让 AI 给我们写一段 python 吧。

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/1cfbe712bec52acc0d1ee50d96e809f2.png)

试着运行这个脚本，oh，输入路径后就成功生成了一篇总合文档！如果你想了解如何让 AI 给你写代码，不妨阅读[《如何用狗屁通（GPT ）解决一个套娃问题》](http://mp.weixin.qq.com/s?__biz=MzU2Njg1NDA3Mw==\&mid=2247484248\&idx=1\&sn=50809b40f520c767483e1a7b0eefb9c1\&chksm=fca76b8ecbd0e298e627140d63e7b3383d226ab293a2e8fefa04b5a1ee12f187520560ec1579\&scene=21#wechat_redirect)。

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/c8dbaf3241dbd50507165524c7ed6451.png)

### **开始训练**

现在要做的事，就是上传这个文件并静待训练成果了。

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/f66100f8d87ea88b7f2d9be6f4db32c7.jpeg)

数据自动分段与清洗完成后，在刚创建的应用设置中的上下文，关联这一篇文档。为了保证响应速度和成本控制，这里直接用 gpt-4o 模型。

![](https://assets-docs.dify.ai/2024/11/5878266c7a7c8729e44fb660b8108393.png)

### **训练成功**

现在再去和这个机器人互动，看看它会回答什么？

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/22d5d5621a1b1eedfdf698cdf8a5ac2d.png)

好了，你已经是个成熟的问答机器人了，可以回答更加复杂的产品问题了。

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/18558406335d11b26717e8b1cf70a673.png)

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/f81842d0d74050c03cc4895c497a26b9.png)

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/038e6c5dab7a8625079669b6bfdb6adc.png)

![](https://assets-docs.dify.ai/dify-enterprise-mintlify/zh_CN/learn-more/use-cases/829c51e5c45e149957df7b5531639d2a.png)

这个问答机器人花了多久做出来，成本如何？

整理语料+训练完成控制在半个小时以内，训练成本 0.27 美元。

现在，AI 可以深入到产品内部，变成妥妥的产品专家。只要有优秀的文档，所有公司都可以打造出专用型问答机器人。

武力对等才会有真正的平权。如果你对我的实践过程同样感兴趣，可以来体验一下我做好的机器人。访问[此地址](https://udify.app/chat/F2Y4bKEWbuCb1FTC)。

不妨也来 Dify 平台训练属于你自己的机器人。做一个考试问答机器人？出题机器人？

{/*
Contributing Section
DO NOT edit this section!
It will be automatically generated by the script.
*/}

<CardGroup cols="2">
    <Card
        title="编辑此页面"
        icon="pen-to-square"
        href="https://github.com/langgenius/dify-docs-mintlify/edit/main/zh-hans/learn-more/use-cases/train-a-qa-chatbot-that-belongs-to-you.mdx"
    >
        通过直接提交修改来帮助改进文档内容
    </Card>
    <Card
        title="提交问题"
        icon="github"
        href="https://github.com/langgenius/dify-docs-mintlify/issues/new?title=文档问题%3A%20-a-qa-chatbot-that-belongs-to-&body=%23%23%20问题描述%0A%3C%21--%20请简要描述您发现的问题%20--%3E%0A%0A%23%23%20页面链接%0Ahttps%3A%2F%2Fgithub.com%2Flanggenius%2Fdify-docs-mintlify%2Fblob%2Fmain%2Fzh-hans/learn-more/use-cases%2Ftrain-a-qa-chatbot-that-belongs-to-you.mdx%0A%0A%23%23%20建议修改%0A%3C%21--%20如果有具体的修改建议，请在此说明%20--%3E%0A%0A%3C%21--%20感谢您对文档质量的关注！%20--%3E"
    >
        发现错误或有改进建议？请提交问题反馈
    </Card>
</CardGroup>
